设为首页

重庆13438161966

戴尔服务器

戴尔企业产品

戴尔PC产品

当前位置:首页 >> 戴尔服务器 >>  戴尔企业产品 >>  戴尔工作站 >>  戴尔工作站显卡 >>  NVIDIA 专业显卡 >>  NVIDIA RTX 高端
  • 型号:Quadro RTX 4000

    Turing GPU

    2,304 NVIDIA ® CUDA ®核心

    288 NVIDIA ® Tensor核心

    36 NVIDIA ® RT核心

    8GB GDDR6 记忆体

    高达416GB/s 记忆体频宽

    43T RTX-OPS

    7.1 TFLOPS FP32 效能

  • 5,800


    特色与介绍

    最先进单插槽专业绘图解决方案

    Quadro RTX 4000将NVIDIA Turing GPU架构与最新的记忆体和显示技术相结合,以单插槽PCI-e结构提供最佳性能和功能。享受更大的流畅性与如照片真实感渲染,体验启用AI-应用更快的性能和创建详细的,栩栩如生的虚拟实境体验。更具成本效益和更加广泛与弹性的工作站机箱配置。

    性能特点

    Turing GPU 架构

    Quadro RTX 4000 GPU 由最先进的12nm FFN (FinFET NVIDIA) 高性能制程制造,为NVIDIA 订做,包含2304 个CUDA 核心,为专业桌面上针对HPC,AI,VR 和绘图工作负载最强大的运算平台。Turing GPU 架构实现了自NVIDIA 在2001 年发明可程式化着色器以来,电脑即时绘图成像最大的跃进。它在545 平方公厘的尺寸上整合了136 亿个电晶体,可提供超过7.1 TFLOPS 单精度(FP32),14.2 TFLOPS 半精度(FP16),28.5 TOPS 整数精度(INT8),以及57.0 TFLOPs Tensor运算能力,完美支援各种计算密集的工作附载。

    RT 核心

    新的硬体光线追踪技术让GPU 首次实现即时产生电影品质般逼真的物件和环境,包括精确的物理阴影,反射,和折射。即时光线追踪引擎与NVIDIA OptiX,Microsoft DXR,和Vulkan API 配合,提供远超出传统成像技术所能达到的真实程度。RT 核心使用通过像素投射少量光线来加速边界体积层次(BVH) 遍历和光线投射功能。

    加强的Tensor核心

    新的混合精度核心为了深度学习矩阵运算而设计,训练时可提供前一代8 倍的TFLOPS。Quadro RTX 4000 利用288 个Tensor核心,每个Tensor核心每个时脉可执行64 个浮点融合乘加(FMA) 运算,每个SM 每个时脉可执行总共1024 个独立的浮点运算。除了支援FP16/FP32 矩阵运算,新的Tensor核心针对矩阵运算增加了INT8 (每个时脉2048 个整数运算) 和实验性的INT4 和INT1 (二进制) 精度模式。

    先进的著色技术

    网格著色:基于运算的几何管线,以加速几何复杂模型和场景的几何处理和剔除。网格著色对于受限于几何能力的工作负载提供高达两倍的效能提升。可变速率着色(VRS):根据场景内容,注视方向,和动作来改变着色速率,以提高成像效率。可变速率着色提供相似的影像品质,但着色的像素减少50%。材质空间着色:物件/材质空间着色可提高像素着色繁重的工作负载效能,如景深和动态模糊。材质空间着色对于像素着色繁重的VR 工作负载,重复使用预先着色材质像素,以提高吞吐量,增加逼真程度。

    高效能GDDR6 记忆体

    Quadro RTX 4000 采用Turing 的高度最佳化8GB GDDR6 记忆体子系统,具备业界最快的绘图记忆体(416 GB/s 峰值频宽),为专门处理大型数据集并对延迟敏感的应用程式理想平台。Quadro RTX 4000 提供比前一代增加70% 的记忆体频宽。

    单一指令,多执行绪(SIMT)

    新的独立执行绪排程功能可在小型工作间共享资源,实现平行执行绪之间更精细的同步和合作。 

    先进串流多处理器(SM) 架构

    结合共享记忆体和L1 快取以大幅提高效能,并简化程式和减少所需的调整来得到最佳的应用程式效能。每组SM 包含96 KB L1/共享记忆体,可根据运算或绘图工作负载,配置各种容量。对于运算工作,最多可分配64 KB 到L1 快取和共享记忆体,而绘图工作负载最多可分配48 KB 到共享记忆体;32 KB L1 和16 KB 材质单元。结合L1 快取和共享记忆体可降低延迟并提供更高频宽。

    混合精度运算

    16 位元浮点精度运算,可将吞吐量加倍并降低储存需求,实现更大型神经网络的训练和部署。Turing SM 具备独立的平行整数和浮点资料路径,对于运算和位址计算混合的工作负载更有效率。

    图形抢占

    像素等级抢占提供更细微的控制,对时间相关的工作支援更佳,例如VR 动态追踪。

    计算抢占

    指令等级抢占提供对计算工作更精细的控制,以避免长时间执行的应用程式独占系统资源或超时。

    H.264 和HEVC 编码/解码引擎

    两个专属的H.264 和HEVC 编码引擎以及独立于3D/运算管线之外的解码引擎可提供比即时更快的转档,影片编辑,和其他编码应用程式效能。

    NVIDIA GPU BOOST 4.0

    自动最大化应用程式效能,而不会超出卡的功耗和散热范围。允许应用程式在更高温下停留在加速时脉状态更久,才会再降到第二温度设定的基本时脉。此功能需要软体应用程式来启动,而不是独立的程式。

    影像品质

    全景反锯齿(FSAA)

    使用高达64X FSAA (SLI 模式下128倍) 大幅降低视觉混叠伪像或「锯齿」以获得优秀的影像品质和极为逼真的场景。

    32K 材质和成像处理

    材质来自并成像到32K x 32K 表面以支援需要最高解析度和品质的影像处理应用程式。

    显示特性

    VirtualLink™

    新的开放式业界标准连接性,适用于下一代VR 头盔,提供四个高速HBR3 DisplayPort 通道,USB3.1 资料通道和高达27 瓦的供电。USB-C 的备用模式针对延迟和频宽需求进行最佳化,以提供更高的显示解析度,并采用高频宽相机,在VR 头盔上用于追踪和扩增实境。

    Multi-View

    可一次产生四个独立画面,大幅降低绘图管线工作负载并提高真实感。同步多重投影(SMP) 引擎比上一代的投影中心加倍,可执行多达两倍的几何成像工作负载。这可让与位置无关的画面具有更大灵活性,产生更多创意场景。

    DisplayPort 1.4

    支援最多四个5K 萤幕@ 60Hz,或每卡两个8K 显示器。Quadro RTX4000 支援HDR 色彩,包括4K @ 120Hz 10/12b HEVC 解码以及高达4K @ 60Hz 10b HEVC 编码。每个DisplayPort 连接头可驱动4096x2160 @ 120 Hz 的超高解析度及30-bit 色彩。

    NVIDIA ® Mosaic™技术

    将桌面和应用程式从单一工作站扩展到最多4 个GPU 和16 个显示器,同时提供完整的效能和影像品质。

    NVIDIA ® Quadro Sync II

    在单一系统的8 个GPU 中同步最多32 个显示器的显示和画面输出(透过两张Sync II 介面卡连接),减少建立高阶影像可视化环境所需的机器数量。








    展开